import pandas as pd
df=pd.DataFrame()
print(df)

Empty DataFrame
Columns: []
Index: []


import pandas as pd
data= [1,2,5,4,6]
Ser=pd.Series(data)
Ser

0    1
1    2
2    5
3    4
4    6
dtype: int64


import pandas as pd
data= [1,2,5,4,6]
Ser=pd.DataFrame(data)
Ser


data = [['Robin',26,45.34],['Karan',25,78.5],['Priya',23,87.67],['Varun',22,56],['Keisha',23,97]]
print(data)

[['Robin', 26, 45.34], ['Karan', 25, 78.5], ['Priya', 23, 87.67], ['Varun', 22, 56], ['Keisha', 23, 97]]


df=pd.DataFrame(data)
df


df=pd.DataFrame(data,columns=['Name','Age','Marks'])
df


data = [('Robin',26,45.34),('Karan',25,78.5),('Priya',23,87.67),('Varun',22,56),('Keisha',23,97)]
df=pd.DataFrame(data,columns=['Name','Age','Marks'])
df


import pandas as pd
data = {'Name':['Ayush', 'Priya', 'Kapil', 'Rohit'],'Age':[28,21,29,42]}
df = pd.DataFrame(data)
df


df = pd.DataFrame(data,	 index=['i1','i2','i3','i4'])
print(df)

     Name  Age
i1  Ayush   28
i2  Priya   21
i3  Kapil   29
i4  Rohit   42


import pandas as pd
data = [{'a': 12, 'b': 32},{'a': 15, 'b': 50, 'c': 23},{'a': 65, 'b': 45, 'c': 19}]
df = pd.DataFrame(data)
df


df = pd.DataFrame(data, index=['First', 'Second','Third'])
df


df1 = pd.DataFrame(data, index=['First', 'Second','Third'], columns=['a', 'b'])
df1


import pandas as pd
data={'Col1': pd.Series([1,5,2,5,6],index=['a','b','c','d','e']), 'Col2': pd.Series([25,87,52,65,89],index=['a','b','c','d','e']) }
df=pd.DataFrame(data)
df


data = [['Robin',26,45.34],['Karan',25,78.5],['Priya',23,87.67],['Varun',22,56],['Keisha',23,97]]
print(data)

[['Robin', 26, 45.34], ['Karan', 25, 78.5], ['Priya', 23, 87.67], ['Varun', 22, 56], ['Keisha', 23, 97]]


import numpy as np
Arr = np.array(data)
Arr

array([['Robin', '26', '45.34'],
       ['Karan', '25', '78.5'],
       ['Priya', '23', '87.67'],
       ['Varun', '22', '56'],
       ['Keisha', '23', '97']], dtype='<U32')


df = pd.DataFrame(Arr)
df


df = pd.DataFrame(Arr,columns = ['Name','Age','Marks'])
df


data = [['Robin',26,45.34],['Karan',25,78.5],['Priya',23,87.67],['Varun',22,56],['Keisha',23,97]]
print(data)

[['Robin', 26, 45.34], ['Karan', 25, 78.5], ['Priya', 23, 87.67], ['Varun', 22, 56], ['Keisha', 23, 97]]


df = pd.DataFrame(data,columns = ['Name','Age','Marks1'])
df


df['Name']

0     Robin
1     Karan
2     Priya
3     Varun
4    Keisha
Name: Name, dtype: object


df.Name

0     Robin
1     Karan
2     Priya
3     Varun
4    Keisha
Name: Name, dtype: object

df


df['Marks2'] = [78,56,98,45,66]


df['Roll No'] = [10,11,12,13,14]

df


df['Total Marks']=df['Marks1']+df['Marks2']
df


del df['Roll No']
df


df.pop('Age')
df

df


df = df.drop(0)
df

DataFrames¶

Empty DataFrame¶

1. Create a DataFrame from List¶

Series vs DataFrame¶

Using Series¶

Using DataFrame¶

Create a DataFrame From 2D List¶

adding column names¶

Create a DataFrame from List of a Tuple¶

2. Create a DataFrame from Dict¶

adding index¶

Create a DataFrame from List of Dicts¶

Note− Observe, NaN (Not a Number) is appended in missing areas.¶

With two column indices, values same as dictionary keys¶

3. Create a DataFrame from Dict of series¶

4. Create a DataFrame from Numpy Array¶

5. Column Selection, Additon & Deletion¶

Selection¶

Select a Single Column¶

or¶

Addition¶

adding new column by adding values of column first and third¶

Deletion¶

deleting column using pop function.¶

Deletion of rows can be done by using drop() function.¶

	0	1	2
0	Robin	26	45.34
1	Karan	25	78.50
2	Priya	23	87.67
3	Varun	22	56.00
4	Keisha	23	97.00

	Name	Age	Marks1	Marks2	Roll No	Total Marks
0	Robin	26	45.34	78	10	123.34
1	Karan	25	78.50	56	11	134.50
2	Priya	23	87.67	98	12	185.67
3	Varun	22	56.00	45	13	101.00
4	Keisha	23	97.00	66	14	163.00

	a	b	c
0	12	32	NaN
1	15	50	23.0
2	65	45	19.0

	a	b	c
First	12	32	NaN
Second	15	50	23.0
Third	65	45	19.0

	a	b
First	12	32
Second	15	50
Third	65	45

	Col1	Col2
a	1	25
b	5	87
c	2	52
d	5	65
e	6	89